查看原文
其他

重新定义搜索:人工智能+搜索带来的机会

阿法兔 阿法兔研究笔记 2023-01-14

PS:欢迎大家关注我的Twitter:@Alphatu4  (深夜写稿不易,会有很多独家内容)

欢迎点击在看、转发~谢谢大家!🐇

请注意:本文提到的部分公司均为BVP Portofolio,请大家本着客观理性的态度阅读,本文不构成任何投资建议或者对项目的推荐

*本文版权归BVP所有,翻译仅为供大家学习使用。

*转载请扫码添加后台微信,转载请注明来源,且附上本文的所有参考文献链接。

作者 |  阿法兔

事件

*本文2100字左右


“搜索”赛道象征着一种横跨消费者、企业和开发者生态系统的、上万亿美元的机会
随着搜索系统变得更加个性化,我们预测搜索和推荐之间的界限将变得模糊。
我们预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。


BVP最近发了一篇文章,其中提到:

人工智能的技术突破,正在重塑信息合成和检索的新模式。从去年开始像ChatGPT、Stable Diffusion、Dreamfusion这类产品的爆红,以及以及即将发布的GPT-4等,大模型的潜力激发了不少新的创业公司。


这里提到的搜索并仅仅是谷歌这样的公共互联网搜索。这里的搜索,指的是能够查询信息,并最终综合和得出结论的能力。


这里对“搜索”的定义,包含企业(B端)文件搜索,到C端对话式的搜索产品等等。


“搜索”赛道象征着一种横跨消费者、企业和开发者生态系统的、上万亿美元的机会:通过人工智能驱动的搜索概览图,我们试图探讨一下,究竟是什么在催化这种进化。


重新定义搜索


机器学习和软件基础设施的进步,释放了全新数据类型,并搜索可以具备理解上下文的能力,那么,这些进步来自于哪些原因?


1. 先进的多模态模型出现。想要搜索比如说图像和视频等非结构化的数据是非常困难的。但是,像OpenAI CLIP和LAION等文本-图像模型那样,近期的进步与技术上的突破,提高了模型的保真度,将非结构化数据嵌入到紧凑表示法中。这些表征通常以矢量体现,这样就可以使更先进的多模态的模型用于图像、视频和其他各类丰富数据类型。例如,Coactive.ai为图像数据提供了SQL的查询界面,能够帮助团队快速访问、组织和利用他们的视觉数据。


2. 语境意识和基本推理的进步:过去的搜索系统提供关键词搜索,但现代模型提供的是语义搜索,或有意义的搜索能力。现代搜索系统也可以感知上下文,并参考用户意图和历史行为。而现在,由于大语言模型的出现,这些系统可以执行基本的推理任务。这样,就带来了一个更为直观和对话式的搜索,它不仅可以理解搜索历史,进行综合研判。

典型的例子就是OpenAI的ChatGPT——提供了更好的搜索工具。ChatGPT以一种看起来带状态的、像人一样的回应的形式展现信息,用户可以反复完善和调整他们的搜索体验。


比如说,如果一个用户问:"我今天应该穿什么?"人工智能工具可能会先问试探性的问题,如 "你想要大家怎么看待你的风格?"然后再综合得出相应答案。


3. 能够建立在现有的成果的基础上。许多大语言模型通过与API的集成和与用户界面的动态交互,插入到现有的软件堆栈中(例如Perplexity、Adept、OpenAI的Codex和谷歌的Mind's Eye的下代搜索产品等等)。同样,像Seek.ai和Hearth.ai这样的公司,也可以模型嵌入到在数据库和CRM中,随着语言模型与现有产品更多地进行对接,搜索系统能够覆盖更多领域,并能更好地进行通知发布。

图片来源:BVP


新兴的大语言模型生态系统


4. 基础设施规模:公司发现了嵌入向量(注解:用一个向量来表示一个词/一个句子/一个图片就叫做嵌入,因为本质是把高维的图像/语言信息在保留一定局部度规的前提下映射到一个较低纬度的空间)的价值,可以在Zilliz(Milvus)、Pinecone、Vespa和Weaviate等向量数据库以及Jina、Qdrant和FAISS等开源库上,继续进行构建和扩展工作负载。除此之外,研究人员也在研究模型大小和数据量等因素,到底会如何影响大型神经网络的模型性能。分布式深度学习领域已经开始发展,排期优化和(数据)并行技术能够进一步扩展人工智能模型和数据量。
排期优化

5. 搜索和推荐的界限会逐步模糊。随着搜索系统变得更加个性化,我们预测搜索和推荐之间的界限将变得模糊。例如,TikTok在最近几年发展迅速,字节跳动的个性化、不断改进的推荐模式体验,已经成功地从Youtube等传统的视频搜索产品中抢占了市场份额,我们预计推荐系统将在未来几年内激增,并从传统搜索中夺取份额。


人工智能正在重新塑造搜索。我们看到消费者和企业搜索以及基础设施层都有持久的创新。

AI搜索市场概览

图片来源:BVP


如果我们从人工智能搜索市场的角度来看,目前人工智能搜索赛道已经出现了一系列公司,比如To C的(Tik Tok也算在其中,还有像Neeva 发布的世界上首个私密和无广告的搜索引擎)、To B,以及专注做基础设施的等等。

智能搜索:刚刚开始的时代


随着人工智能降低高质量创建的内容的质量和制作成本,数字内容的数量将出现爆炸性增长。我们预测,在未来十年内,至少50%的在线内容将由人工智能产生、或者由人工智能改进。随着信息爆炸的时代到来,会需要更好的智能搜索,来组织和总结这些信息。

随着用户数据越来越重要,甚至成为企业的关键资产,企业可以用搜索体验来更好地分析数据,以进行商业决策,而在消费者环境中,人们将从更准确、更个性化、更精细的结果中受益,这将影响到人们联系、购物或学习的方式。


参考文献:1.https://www.bvp.com/atlas/entering-the-era-of-intelligent-search?utm_source=email&utm_medium=organic&utm_campaign=entering-the-era-of-intelligent-search


欢迎大家关注我的Twitter:@Alphatu4 

1月11日上面也发了个ChatGPT和教育结合的分析文档



【阅读更多】

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存